智能论文笔记

Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

Kensho Hara , Hirokatsu Kataoka , Yutaka Satoh

分类：

2017-11-27

The purpose of this study is to determine whether current video datasets have sufficient data for training very deep convolutional neural networks (CNNs) with spatio-temporal three-dimensional (3D) kernels. Recently, the performance levels of 3D CNNs in the field of action recognition have improved significantly. However, to date, conventional research has only explored relatively shallow 3D architectures. We examine the architectures of various 3D CNNs from relatively shallow to very deep ones on current video datasets. Based on the results of those experiments, the following conclusions could be obtained: (i) training resulted in significant overfitting for UCF-101, HMDB-51, and Ac-tivityNet but not for Kinetics. (ii) The Kinetics dataset has sufficient data for training of deep 3D CNNs, and enables training of up to 152 ResNets layers, interestingly similar to 2D ResNets on ImageNet. ResNeXt-101 achieved 78.4% average accuracy on the Kinetics test set. (iii) Kinetics pretrained simple 3D architectures outperforms complex 2D architectures, and the pretrained ResNeXt-101 achieved 94.5% and 70.2% on respectively. The use of 2D CNNs trained on ImageNet has produced significant progress in various tasks in image. We believe that using deep 3D CNNs together with Kinetics will retrace the successful history of 2D CNNs and ImageNet, and stimulate advances in computer vision for videos. The codes and pretrained models used in this study are publicly available1.

translated by 谷歌翻译

Online Convex Optimization of Programmable Quantum Computers to Simulate Time-Varying Quantum Channels

Hari Hara Suthan Chittoor , Osvaldo Simeone , Leonardo Banchi , Stefano Pirandola

分类：人工智能 | 机器学习

2022-12-09

Simulating quantum channels is a fundamental primitive in quantum computing, since quantum channels define general (trace-preserving) quantum operations. An arbitrary quantum channel cannot be exactly simulated using a finite-dimensional programmable quantum processor, making it important to develop optimal approximate simulation techniques. In this paper, we study the challenging setting in which the channel to be simulated varies adversarially with time. We propose the use of matrix exponentiated gradient descent (MEGD), an online convex optimization method, and analytically show that it achieves a sublinear regret in time. Through experiments, we validate the main results for time-varying dephasing channels using a programmable generalized teleportation processor.

translated by 谷歌翻译

Learned k-NN Distance Estimation

Daichi Amagata , Yusuke Arai , Sumio Fujita , Takahiro Hara

分类：人工智能 | 机器学习

2022-08-29

众所周知，大数据挖掘是数据科学的重要任务，因为它可以提供有用的观察结果和隐藏在给定的大数据集中的新知识。基于接近性的数据分析尤其在许多现实生活中使用。在这样的分析中，通常采用了与K最近的邻居的距离，因此其主瓶颈来自数据检索。为提高这些分析的效率做出了许多努力。但是，他们仍然会产生巨大的成本，因为它们基本上需要许多数据访问。为了避免此问题，我们提出了一种机器学习技术，该技术可以快速准确地估算给定查询的K-NN距离（即与K最近的邻居的距离）。我们训练完全连接的神经网络模型，并利用枢轴来实现准确的估计。我们的模型旨在具有有用的优势：它一次不距离K-NN，其推理时间为O（1）（未产生数据访问），但保持高精度。我们对实际数据集的实验结果和案例研究证明了解决方案的效率和有效性。

translated by 谷歌翻译

Learning Distributed Quantum State Discrimination with Noisy Classical Communications

Hari Hara Suthan Chittoor , Osvaldo Simeone

分类：人工智能 | 机器学习

2022-07-22

考虑一个分布式量子传感系统，其中爱丽丝和鲍勃的任务是检测量子系统的状态，该状态在Alice部分观察到Alice，部分通过本地操作和经典通信（LOCC）在BOB处观察到。先前的工作引入了LOCCNET，这是一种分布式协议，可通过Alice和Bob的参数化量子电路（PQC）优化本地操作。本文在存在嘈杂的经典交流的情况下提出了噪声意识 - 洛克内特（Na-loccnet），用于分布式量子状态歧视。我们为两个观察到的量子对的情况提出了特定的Ansatzes，并描述了噪音吸引人的训练设计标准。通过实验，我们观察到，当经典通信嘈杂时，量子，纠缠破裂，观察到的量子系统上的噪声对于提高系统的检测能力很有用。

translated by 谷歌翻译

Portuguese Man-of-War Image Classification with Convolutional Neural Networks

Alessandra Carneiro , Lorena Nascimento , Mauricio Noernberg , Carmem Hara , Aurora Pozo

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-04

葡萄牙人战士（PMW）是一种凝胶生物体，具有长长的触手，能够造成严重的燃烧，从而导致对人类活动（例如旅游和捕鱼）的负面影响。缺乏有关该物种的时空动力学的信息。因此，使用替代方法收集数据可以有助于其监视。鉴于社交网络的广泛使用和PMW的引人注目的外观，Instagram帖子可能是监视的有前途的数据源。遵循此方法的第一个任务是识别指向PMW的帖子。本文报告了使用卷积神经网络进行PMW图像分类，以自动识别Instagram帖子。我们创建了一个合适的数据集，并训练了三个不同的神经网络：VGG-16，RESNET50和InceptionV3，并在Imagenet数据集中进行了预先训练的步骤。我们使用准确性，精度，召回和F1评分指标分析了他们的结果。预先训练的RESNET50网络提供了最佳结果，获得了94％的精度和95％的精度，召回和F1分数。这些结果表明，卷积神经网络对于识别Instagram社交媒体的PMW图像非常有效。

translated by 谷歌翻译

Coded Consensus Monte Carlo: Robust One-Shot Distributed Bayesian Learning with Stragglers

Hari Hara Suthan Chittoor , Osvaldo Simeone

分类：机器学习

2021-12-17

这封信研究在包含中央服务器和多个工人的环境中分布了贝叶斯学习，专注于减轻摔跤手的影响问题。通过提出基于分组和编码的两种级体弹性解决方案，标准单次单次或令人尴尬地平行，称为共识Monte Carlo（CMC）是推广的。所提出的方法称为基于组的CMC（G-CMC）和编码的CMC（C-CMC），利用工人冗余计算，以便根据来自的部分输出来估算服务器上的全局后部样本工人。仿真结果表明，C-CMC可能占G-GCMC的少量工人，而G-CMC通常优选用于更大数量的工人。

translated by 谷歌翻译

HARA: A Hierarchical Approach for Robust Rotation Averaging

Seong Hun Lee , Javier Civera

分类：计算机视觉

2021-11-16

我们提出了一种用于多旋转平均的新型等级方法，称为Hara。我们的方法基于Triplet支持的层次逐渐初始化旋转图。关键的想法是通过利用许多强三联网支持的边缘和逐渐添加具有较弱和更少支持的边缘来构建生成树。这降低了在生成树中添加异常值的风险。因此，我们获得了一个强大的初始解决方案，使我们能够在非线性优化之前过滤异常值。通过更新的修改，我们的方法还可以集成有效的2D-2D对应关系的数量。我们对合成和实际数据集进行广泛的评估，证明了最先进的结果。

translated by 谷歌翻译

Characterizing the risk of fairwashing

Ulrich Aïvodji , Hiromi Arai , Sébastien Gambs , Satoshi Hara

分类：机器学习

2021-06-14

FAIRWASHING是指通过HOC解释操纵来解释不公平的黑匣子模型的风险。在本文中，我们通过分析其忠诚 - 不公平权衡来调查私人洗脱袭击的能力。特别是，我们表明，巧巧式化的解释模型可以概括起诉组（即，正在解释的数据点），这意味着巧式化的解释者可用于合理化黑匣子模型的后续不公平决策。我们还表明，私人洗涤攻击可以跨黑盒式机型转移，这意味着其他黑匣子型号可以在不明确使用他们的预测的情况下进行私人洗手。这种泛化和私伤攻击的可转移性意味着他们的检测在实践中难以实现。最后，我们提出了一种方法来量化私人洗礼的风险，这是基于高保真解释者的不公平性范围的计算。

translated by 谷歌翻译

Constrained Generalized Additive 2 Model with Consideration of High-Order Interactions

Akihisa Watanabe , Michiya Kuramata , Kaito Majima , Haruka Kiyohara , Kensho Kondo , Kazuhide Nakata

分类：机器学习

2021-06-05

近年来，在许多工业领域引入了机器学习和AI。在诸如金融，医学和自主驾驶的领域，其中模型的推理结果可能具有严重后果，需要高的可解释性以及预测准确性。在这项研究中，我们提出了CGA2M +，其基于广义添加剂2模型（GA2M），并以两种主要方式不同。首先是单调性引入。基于分析师的知识基于某些功能对某些功能进行体重，而且预计不仅可以改善可解释性，而且还改善了概括性表现。第二个是引入高阶项：鉴于Ga2m仅考虑二阶交互，我们旨在通过引入可以捕获更高阶交互的更高阶项来平衡解释性和预测准确性。通过这种方式，我们可以通过应用学习创新来改善预测性能而不会影响可解释性。数值实验表明，该模型具有高预测性能和可解释性。此外，我们证实通过引入单调性来改善泛化性能。

translated by 谷歌翻译